import pandas as pd
import numpy as np
# 读取CSV文件
df = pd.read_csv('insurance.csv')
# 检查是否有缺失数据
print(df.isnull().sum())

# 检查是否有重复的行
print(df.duplicated().sum())

# 删除重复的行
df.drop_duplicates(inplace=True)

# 检查和处理错误数据，这可能需要数据领域的专业知识，此处以年龄小于0为例
df = df[df['age']>0]
df = df[df['charges']>0]

# 整理完后重新查看数据
print(df.info())